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烟草 香气 相关 基因 CRISPR/Cas9 编辑 突变 体 库 的 构建 
Pill, ZÉpQ?, Gi, SII], FI), ED FAX) migi” 
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昆明 650201) 

摘 要 : 为 探究 CRISPR/Cas9 基因 编辑 技术 构建 烟草 突变 体 库 的 可 行 性 ， 该 研究 筛选 了 100 个 可 能 
参与 烟草 香气 代谢 的 基因 ， 设 计 相 应 的 100 个 sgRNA 并 构建 了 由 100 个 CRISPR/Cas9 编辑 载体 组 
成 的 质粒 库 ， 获得 转基因 材料 后 分 析 了 载体 的 共 转 化 率 、 革 向 编辑 效率 和 脱衣 编辑 情况 。 结 果 表 明 : 
(1) 通 过 农 杆 菌 介 导 100 个 sgRNA 的 共 转 化 后 ,在 172 个 阳性 转化 株 中 检测 到 了 其 中 的 77 个 sgRNA， 
转化 效率 为 77%; (2) 在 77 个 携带 sgRNA 的 转基因 后 代 中 ，69 个 sgRNA 对 目标 基因 进行 了 部 
向 编辑 ， 编 辑 效率 为 89.990; (3) 脱 诅 位 点 测序 检测 发 现 ， 只 有 一 个 sgRNA 在 非 目 标 靶 位 点 产生 
了 脱 诅 编辑， 表明 CRISPR/Cas9 基因 编辑 技术 在 烟草 中 的 脱 靶 概率 非常 低 。 综 上 所 述 ， 利 用 
CRISPR/Cas9 载体 库 共 转化 对 烟草 基因 进行 高 通 量 靶 向 编辑 以 构建 突变 体 库 的 方法 是 切实 可 行 ， 且 
该 方法 有 共 转 化 效率 高 、 编 辑 效率 高 和 脱 靶 编辑 概率 低 等 特点 。 
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Abstract: To explore the feasibility of constructing a tobacco mutant library using the CRISPR/Cas9 gene 


editing technology, the study designed sgRNAs of 100 aroma related genes in tobacco, constructed a 
plasmid library composed of 100 corresponding CRISPR/Cas9 editing vectors, and analyzed the 


co-transformation rate, target editing efficiency, and off-target editing rate of transgenic offspring. The 


基金 项 目 : 云南 省 烟草 化 学 重点 实验 室 开放 课题 (2021539200340248); 中 国 烟草 总 公司 重大 科技 项 目 (110202101034 
(JY-11) ) 。 

第 一 作者 : 曾 婉 俐 ， 博 士 ， 主 要 从 事 烟 草 育 种 研究 ，(E-mail)165691973@qq.com。 

“通信 作者 : 向 海 英 ， 博 士 ， 副 研究 员 ， 主 要 从 事 烟 草 育 种 研究 ，(E-mail)casexhy@126.com。 


results were as follows: (1) After co-transformation of 100 sgRNAs mediated by Agrobacterium 
tumefaciens, 77 of them were detected in 172 positive transformation strains, with a co-transformation 
efficiency of 77%; (2) Among 77 transgenic offspring carrying sgRNA, 69 sgRNAs edited the target genes, 
with an editing efficiency of 89.6%; (3) Sequencing detection revealed that only one sgRNA produced 
off-target editing at a non-target site, indicating a very low probability of off-target editing of 
CRISPR/Cas9 in tobacco. In summary, it is feasible to construct a mutant library by the co-transformation 
of a CRISPR/Cas9 vector library to edit a large number of candidate target genes in tobacco. This method 
has the characteristics of the high co-transformation efficiency, the high editing efficiency, and the low 
probability of off target editing. 
Keywords: tobacco, CRISPR/Cas9, aroma, on-target editing, off-target editing 
CRISPR/Cas9 基因 编辑 是 一 种 在 基因 组 水 平 上 对 DNA 序列 进行 定点 改造 的 遗传 操作 技术 。 

CRISPR 基因 编辑 系统 由 Cas9 核酸 酶 和 引导 RNA (single guide RNA,sgRNA) 组 成 。sgRNA 的 一 段 

(~20 bp) 与 对 基因 互补 的 DNA 序列 可 以 特异 性 地 识别 裔 DNA, mi Cas9 核酸 酶 对 靶 DNA 进行 
WE, ERE DNA 的 断裂 ， 诱 发 内 源 性 DNA 的 非 同 源 末 端 修 复 机 制 (Jinek et al., 2012)。DNA 
修复 过 程 会 引起 DNA 核 苷 酸 的 缺失 或 增加 等 错 配 , 导致 基因 移 码 突变 , 实现 基因 敲 除 .CRISPR/Cas9 
基因 编辑 系统 也 可 以 对 目的 基因 进行 特定 修饰 《如 点 突变 和 基因 插入 ) 。 例 如 ， 在 CRISPR 基因 前 
除 构建 策略 的 基础 上 ， 添 加 计划 揪 入 修饰 的 DNA 片段 ， 就 可 以 对 特定 基因 插入 和 蔡 换 遗传 修饰 

CRISPR/Cas9 基因 编辑 系统 因 其 低 成 本 、 构 建 简单 和 高 效 等 优点 ， 已 经 在 人 类 、 动 物 和 植物 等 

生物 体 中 被 广泛 利用 ， 目 前 已 成 为 基因 功能 研究 和 基因 定向 修饰 的 一 个 有 效 工具 (Knott & Doudna 
2018: Chen et al., 2019)。 在 植物 中 的 应 用 表明 ，CRISPR/Cas9 系统 不 仅 可 高 效 诱导 产生 DNA RY, 
而 且 诱 导 的 突变 可 稳定 遗传 。 该 技术 可 以 在 基因 组 水 平 上 对 DNA 序列 进行 定点 改造 以 创制 优异 
质 资 源 。 例 如 ， 利 用 CRISPR/Cas9 基因 编辑 技术 将 普通 烟草 中 N" 基 因 的 抗 性 核心 区 域 精准 替换 为 
野生 烟 中 N'alata 基因 的 对 应 区 域 , 使 得 栽培 烟草 获得 了 TMV-UI 抗 性 (Li et al., 2023 )。 利 用 CRISPR 
技术 对 NIC 基因 进行 编辑 产生 了 尼古丁 含量 极 低 的 烟草 新 种 质 〈Qin et al., 2021) o CRISPR/Cas9 
基因 编辑 技术 还 可 用 于 水 稻 和 番茄 等 作物 的 快速 驯化 〈Lemmon et al., 2018; Li et al., 2018; Yu et al., 
2021), 为 加 快 新 品种 创制 奠定 了 基础 .CRISPR/Cas9 基因 编辑 技术 在 烟草 中 的 成 功 应 用 (Schachtsiek 
& Stehle, 2019; Zhang et al., 2023) ， 预 示 着 该 技术 在 着 未 来 烟草 育种 中 蕴藏 着 巨大 的 潜力 。 
烟草 香味 是 烟叶 及 卷烟 感官 质量 的 重要 指标 之 一 。 烟 草 的 香气 前 体 物 主要 有 质 体 色素 、 西 柏 烷 
和 赖 百 当 类 菇 醇 、 酚 类 化 合 物 、 和 氨基酸 和 还 原 糖 、 脂 类 、 生 物 碱 等 六 个 大 类 ( 汪 漆 富 等 ，2006)。 不 
同 烟 草 品种 的 香气 前 体 种 类 及 含量 烟 不 同 ， 因 为 其 内 在 香气 前 体 合 成 相关 基因 的 表达 不 同 ( 吕 婧 等 ， 
2014); 也 就 是 说 ,烟草 香气 前 体 种 类 和 含量 很 大 程度 上 由 烟草 本 身 的 遗传 因素 决定 。 随 着 烟草 基因 
组 测序 的 完成 ， 次 生 代 谢 产物 相关 合成 相关 酶 的 基因 注释 也 日 趋 完善 。 因 此 ， 从 基因 层面 挖掘 控制 
草 香气 前 体 物 的 关键 基因 ， 通 过 遗传 操作 改变 相关 基因 的 表达 水 平 可 以 实现 定向 培育 特定 香味 的 
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烟草 品种 。 利 用 CRISPR-Cas9 对 烟叶 香味 基因 进行 高 通 量 靶 向 突变 ， 将 为 优异 性 状 新 种 质 的 创建 、 
重要 


功能 基因 的 批量 挖掘 以 及 烟草 分 子 设计 育种 黄 定 基础 。 


传统 烟草 育种 工作 主要 靠 多 亲本 多 组 合 ， 也 就 是 将 不 同 优良 性 状 的 烟草 种 质 资源 进行 遗传 整合 ， 


构建 优质 烟草 新 品种 。 但 是 ， 


多 年 时 间 。 一 些 优异 性 状 因为 联 锁 累 更 而 无 法 整合 在 同一 品种 里 ， 也 在 一 定 程度 上 限制 了 优异 品种 
的 创制 。CRISPR/Cas9 基因 编 
突破 传统 杂交 育种 无 法 将 连锁 优异 位 点 进行 整合 的 限制 , 因此 利用 CRISPR/Cas9 基因 组 编辑 技术 有 
速 烟草 香味 品质 改良 。 

尽管 基因 编辑 技术 已 被 应 用 于 构建 水 稻 、 玉 米 等 突变 体 库 ， 但 尚未 应 用 于 烟草 基因 突变 体 库 的 
构建 。 本 研究 以 烟草 栽培 品 
进行 对 向 设计 ,构建 CRISPR/Cas9 载体 库 并 进行 共 转 化 ， 获 得 了 烟草 香味 品质 相关 的 基因 编辑 突变 
体 库 。 基 因 打 鞭 和 脱 朋 分 析 表 明 ， 利 用 CRISPR-Cas9 技术 构建 烟草 突变 库 是 切实 可 行 的 。 本 研究 旨 


望 加 j 


这 种 传统 的 杂交 育种 方式 不 仅 耗费 大 量 人 力 及 金钱 成 本 ， 而 且 要 耗费 


辑 技术 可 以 不 依赖 于 遗传 杂交 对 紧密 连锁 的 基因 进行 同时 编辑 ， 可 以 


' 红 花 大 金 元 为 材料 ， 对 其 100 个 可 能 与 烟草 香味 品质 相关 的 功能 基因 


验证 烟草 高 通 量 基 
1 材料 与 方法 
1.1 实验 材料 

本 文 以 烤烟 品 


1.2 SEA FF A BEA 
香味 相关 候选 基因 的 注 
100 Chttps://www.ncbi.nlm.nih.gov/genome/annotation euk/Nicotiana tabacum/100/) 。 利 用 在 线 工 具 
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! 红 花 大 金 元 为 实验 材料 。 


释 参 考 烟草 基因 组 数据 库 NCBI Nicotiana tabacum Annotation Release 


CRISPR-GE (http://skl.scau.edu.cn/; Xie et al., 2017) 设计 目标 基因 的 特异 靶 位 点 ， 从 候选 靶 位 点 中 


选择 位 于 基因 编 


码 区 前 端的 诅 点 。 依 据 革 位 点 设计 和 克隆 原则 设计 引物 ， 正 向 引物 为 
5'--NNNNNNNNNNNNNNNNNNNNGTTT-3' : E [n] 5| 物 为 


5S-NNNNNNNNNNNNNNNNNNNNAATC-3'。 其 中 正 向 引物 的 20 个 N 是 靶 位 点 序列 ， 反 向 引物 的 
20 个 N 是 靶 位 点 序列 的 反 向 互补 序列 ， 引 物 退 火 后 的 粘性 末端 恰好 与 载体 Bsa I 线性 化 后 的 载体 形 


成 碱 基 互 补 配对 。 


L3 CRISPR/Cas9 载体 构建 方法 


以 克隆 一 个 基 
引物 和 反 向 引物 ; 


(2) ЖП 


因 的 CRISPR/Cas9 载体 为 例 : (1) 按照 上 述 的 引物 设计 原则 ， 合 成 相应 的 正 向 


E 向 引物 和 反 向 引物 进行 退化 反应 ， 形 成 双 链 DNA[ 退 火 反 应 体系 : 


5xAnnealing Buffer for DNA Oligos 4 hbL， 上 下 游 引 物 各 4 uL C50 umoluL') , Nuclease-free water Ж} 
至 20 HL。 反应 程序 95?C 5 min, 每 8s [Ё[®0.1°С, HA 25 °С (4) 90min) ， 然 后 4°C 保 存 ) |; 


(3) 将 退火 反应 得 到 的 产物 连接 到 经 Вѕа І 酶 切 的 CRISPR/Cas9 载体 pORE-Cas9/ gRNA 上 [连接 体 
Ж: 退火 产物 2 uL， 酶 切 产 物 3 WL, 10xT4 DNA Ligase Buffer 2 uL, T4 DNA Ligase (400-1!) 


1 uL, Ж КЖК 20 uL]; 


列 ) ; (5) ЖЇНЇ 
1.4 遗传 转化 


Epal 


将 100 个 质粒 的 浓度 均 调整 为 100 ng/uL 的 ， 每 个 取 1 uL, HS, $78 
ERA REAM KAGAN YEB 培养 基 上 ， 黑 暗 条 件 下 28 °C 培养 3 do 
草 的 CRISPR-Cas9 编辑 菌 种 。， 
‚ Y 26°C. 16h Jt/8h li 


ШЕ 
脱 全 部 菌落 ，-80 СИКА, (ЕА 


d. 


月 H 


培养 30 d, 备 月 


Ho fri 


液 
离心 管内 。 将 叶 盘 转移 到 盛 有 菌 
基 上 ，28 "C， 黑 暗 ， 共 培 养 3 d。 
6-BA (0.5 yug ml). REF 
(28°С, JER 16h) / (25 


°С, 


期 转化 烟 


1, RE 4 HAH (430d) ， 便 可 将 
工作 台中 , 用 打 孔 器 将 中 
本 培养 基 将 YEB 培养 基 活 化 的 CRISPR-Cas9 3 


(4) 连接 产物 转化 DH5a 
游 引 物 为 U6-F: 5'--GATCTCCCAGTCACGACGTT-3', Fits WAAL 
斑 ， 提 取 质 粒 ， 进 行 测序 验证 。 


液体 


受 态 细胞 ， 利 用 菌落 PCR 筛选 阳性 克隆 (上 
的 基因 上 靶 位 点 的 反 向 互补 序 


转化 农 杆菌 GV1301， 涂 


YEB 


因 草 


子 所 


种 于 


移入 培养 瓶 


之 后 将 叶 盘 下 表 


GR (500 ug-mL!) ‚ EJ 


и Sh) 条 但 


(1-2 em). 插入 含有 羧 葵 青霉素 和 卡 


1.5 编辑 素材 的 鉴定 
为 每 个 烟草 单 株 编号 ， 


向 引物 对 产物 进行 测序 。 通 过 序列 

因 ， 并 在 肢 位 点 两 侧 设计 靶 基因 

对 分 析 相应 单 株 的 靶 位 点 是 否 被 编 

2 结果 与 分 析 

2.1 靶 位 点 设计 
根据 烟草 基 医 

成 相关 的 基 


“Pr 


ANS 


日 的 功能 注释 以 及 文 
B (图 1) ， 它 们 编码 的 蛋 


Г“ 2) 


每 个 单 株 取 少 许 叶 片 提 取 ОМА. 
CTTCAAAAGTCCCACATCGCTTAG; Xi]: TGCAGGACTAGTGGATCAGC) 进行 PCR， 并 月 


(EET 


液 的 50 mL ACEN, x 


片 打 成 直径 5mm 大 小 的 圆 形 中 


种 悬浮 成 菌 液 COD600: 0.6-0. 


Hit. FH] 40 mL MS 


8) E T 50 mL 
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包 侵 染 10 min. ZA PA] 
面 接触 培养 基 ， 放 置 于 含 
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HAMESE (212 MAE) 
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k 5l 


比 对 ， 提 取 相 应 单 株 的 靶 位 点 序列 。 根 据 靶 点 序列 匹配 
的 特异 性 引物 ， 进 行 PCR 扩 增 ， 对 PCR 产物 测序 。 通 过 序列 比 


辑 。 


献 调研 ， 本 


学 过 程 。CRISPR/Cas9 编辑 技术 可 
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j 来 对 特定 基因 


fi 


究 选择 了 100 个 可 能 参与 烟 


i 辑 系统 由 Cas9 蛋白 和 sgRNA (single guide RNA) 组 成 ， 


端 20 个 碱 基 通 过 碱 基 互 补 本 
代表 4 种 碱 基 
位 点 可 以 选择 。 为 保证 对 特定 基 
为 每 个 基因 设计 了 特异 性 的 靶 位 点 
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体 ， 靶 位 点 设计 在 目标 基因 靠 前 的 


外 显 子 编码 


区 区 域 (图 1) 。 针 对 同一 个 基因 


un 


E EJ] fit] Т ВЕ GRAS AE {Ж „ 
Cas9 负责 剪 切 DNA 
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本 研究 利用 CRISPR/Cas9 Yi 


"mé 


参与 次 生 代谢 产物 合成 ， 离 子 吸 收 转运 和 信号 转 


固体 培养 


MS 


NAA (0.02 pg-mL!) 、 
BÆR (100 pg-mL) 的 MS 培养 基 上 ， 在 
F 下 培养 ， 至 长 
g 霉 素 的 MS 培养 基 上 进行 生根 培养 ， 分 化 芽 约 10 d 后 1 
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CRISPR/Cas9 


气 前 


， 而 sgRNA 前 


LC 对 的 方式 识别 鞭 位 点 。 革 位 点 的 3' 端 还 应 包含 一 个 由 3 个 碱 基 NGG CN 
的 一 种 ) 组 成 的 PAM ( Protospacer Adjacent Motif) 基 序 。 同 一 个 基因 


因 的 编辑 特异 性 


XS CE ERE 


十 工具 CRISPR-GE 
果 通 过 CRISPR/Cas9 编辑 获得 的 突变 体 为 功能 缺失 型 突变 


存在 多 个 不 同 转录 


本 情况 ， 靶 位 点 选择 在 这 些 转 录 本 的 共有 外 显 子 编码 区 域 。 烟 草 属于 异 源 四 倍 体 植物 ， 某 些 基 因 通 


常 存在 一 个 序列 高 度 相 似 的 同 源 基 因 。 对 一 些 存 在 序列 高 度 相似 同 源 序列 的 基因 ， 设 计 工 具有 时 无 


法 设计 误 向 单一 基因 的 sgRNA CHE ES sgRNA) 。 针 对 这 种 情况 ， 本 研究 选择 了 可 以 同时 章 


向 两 


个 同 源 基 因 的 ssRNA COUR ES sgRNA) (图 1) 。 由 于 撮 位 点 的 GC 含量 比例 增加 可 以 提高 编辑 效 


率 ， 所 以 当 存 在 多 个 可 选 靶 位 点 时 ， 本 研究 选择 了 GC 含量 最 高 的 靶 位 点 (图 1) 。 


参考 NCBI Nicotiana tabacum Annotation 
Release 100 的 基因 注释 


Gene annotation from NCBI Nicotiana 
tabacum Annotation Release 100 


| 


100 个 烟草 香味 相关 的 候选 基因 
100 aroma related genes 


利用 CRISPR-GE 工 具 设计 靶 位 点 
Design target sites with CRISPR-GE 


靶 位 点 选择 条 件 Criteria for target sites: 
І. 靶 位 点 GC>359%6 GC content>35% 
2. 脱 靶 位 点 错 配 碱 基 三 1 
Base mismatch at off-target site — 1 
3. 位 于 共有 外 显 子 编码 区 


Located in the common exon 


图 1 候选 基因 的 靶 位 点 设计 
Fig. 1 Target site design of candidate genes 


2.2 CRISPR/Cas9 载体 库 构 建 


U6-26 启动 子 用 来 驱动 sgRNA 骨架 达 。 载 体 上 的 sgRNA 前 端 预 留 了 一 段 20 bp 的 插入 序列 ， 


列 包含 两 个 Bsal 酶 切 位 点 (图 2，。 载 体 经 Bas I 酶 切 后 ， 产 生 两 个 特异 性 的 粘性 末端 ， 可 用 来 连 


入 20 bp 的 对 位 点 序列 。 根 据 方法 中 提 及 的 靶 位 点 引物 设计 原则 合成 一 对 包含 20 bp LITE 
的 引物 ,这 一 对 引物 经 过 退火 反应 后 形成 的 双 链 DNA 包含 两 个 与 载体 匹配 的 粘性 末端 .由 于 该 


在 本 研究 所 用 的 基因 编辑 载体 中 ， 烟 草花 叶 病毒 的 35S 启动 子 用 来 驱动 Cas9 基因 ， 拟 南 芥 的 


该 序 


序列 
DNA 


的 两 个 粘性 末端 恰好 可 以 与 编辑 载体 的 粘性 末端 完全 匹配 (图 2) ， 所 以 可 以 通过 ТАРМА 连 酶 将 


后 形成 了 一 个 CRISPR/Cas9 载体 库 。 


片段 与 载体 连接 。 连 接 反 应 后 ， 转 化 大 肠 杆 菌 ， 抗 性 板 筛 选 菌 斑 ，PCR 扩 增 鉴定 阳性 克隆 ， 测 序 正 
确 后 提取 质粒 。 通 过 该 流程 ， 本 研究 总 共 构 建 了 100 个 CRISPR/Cas9 质粒 ， 这 些 质粒 按 等 比例 混合 


ЖЕ ОМА Bsa 1 Ё] 
Single strand DNA Digested with Bsa I CRISPR/Cas9 编 辑 突变 体 库 
CRISPR/Cas9 mutant libray 


F: NNNNNNNNNNNNNNNNNNNNGTTT --AGTGATTAGAGACCAAGGTCTCAGTTTTAG-- 
R: NNNNNNNNNNNNNNNNNNNNAATC --TCACTAAATCTCTGGTTCCAGAGTCAAAATC-- | 
i Bsal 
退火 形成 双 链 DNA 基因 打靶/ 脱 革 分析 
Anealing to double strand DNA Analysis of on-target/off-target 
NNNNNNNNNNNNNNNNNGTIT 
CTAANNNNNNNNNNNNNNNNN Ng Pg 1 
TA DNARS = He XXX! % 
Ligate with Т4 DNA ligase ES) EY) W W W ES) 
--АСТСАТТ NNNNNNNNNNNNNNNNNGTIT TAG-- 
-TCA CTAANNNNNNNNNNNNNNNNN CAAAATC-- 59999955 
PP d d ДЕ ДЕ ДЕ ДЕ 
2999999 9 
OOOO O 
1 з 4 sem 100 
载体 
Plamid liabray 


图 2 CRISPR/Cas9 编辑 突变 体 库 构 建 流 程 
Fig. 2 Schematic diagram of the CRISPR/Cas9 edited mutant library 


2.3 CRISPR/Cas9 编辑 分 析 


为 了 构建 突变 体 库 ， 本 研究 将 上 述 的 CRISPR/Cas9 载体 库 转 化 农 杆菌 ， 然 后 通过 


ж, р 


ШЕЛ ЛЕ Ж ЙО Je DE EE ТЕ ЕХ 


WIA ИА 
烟草 幼苗 。 由 于 转基因 植物 携带 了 U6-26/sgRNA PA, A 


此 可 以 在 U6-26 启动 子 区 和 ssRNA 区 分 别 设计 上 、 下 游 引物 并 通过 PCR 测序 获取 阳性 转基因 植物 


的 靶 位 点 序列 (图 


3) 。 根 据 提取 的 贰 位 点 序列 找到 其 对 应 的 误 位 点 及 靶 基 因 。 在 靶 位 点 两 侧 设 计 


特异 性 引物 ，PCR 扩 增 后 测序 ， 然 后 通过 序列 比 对 分 析 判 断 训 基因 是 否 在 误 位 点 附近 被 编辑 。 丁 
究 从 172 个 转基因 植株 中 鉴定 到 77 个 不 同 sgRNA 
代 植 株 ， 然 后 从 每 个 sgRNA 株 系 中 选择 7 个 单 株 ; 


的 植株 。 收 获 ТО 代 阳 性 植株 的 种 子 后 ， 
行 台 位 点 测序 分 析 。 测 序 结果 表明 ， 在 61 个 单 


种 植 Tl 


HELA sgRNA 中 ，55 PG LANIE, 6 个 没有 鞭 向 编辑 ， 在 16 PALAD Ki sgRNA 中 ，13 个 靶 向 编辑 
了 双 靶 基因，1 个 靶 向 编辑 了 两 个 识 基 因 的 一 个 ，2 个 未 靶 向 编辑 靶 〈 表 1) 。sgRNA 的 靶 问 编辑 
KI] 89.6% (69/77) . 


靶 位 点 


Target site 


图 3 阳性 植株 sgRNA 序列 的 扩 增 


Fig. 3 Acquisition of sgRNA sequences in positive transgenic plants 


2.4 CRISPR/Cas9 ffi $8 4) HT 

为 了 评估 编辑 植株 中 是 否 存在 脱 靶 编辑 的 情况 ， 本 研究 利用 BLAST 软件 预测 了 77 个 sgRNA 
的 潜在 脱 靶 位 点 。 已 有 研究 表明 ssRNA 与 脱 误 位 点 的 碱 基 错 配 数量 大 于 1 个 就 可 以 阻止 该 位 点 被 
编辑 ， 而 1 个 碱 基 错 配 仍 有 较 大 可 能 会 导致 脱衣 编辑 发 生 (Naeem et al., 2020) ， 因 此 本 研究 只 分 
析 了 存在 1 个 错 配 碱 基 的 脱 靶 位 点 是 否 被 编辑 。 在 获得 的 77 个 sgRNA 中 ，20 个 ssRNA 有 一 个 脱 
WU ri, 1S sgRNA 有 2 个 脱 靶 位 点 〈 表 1) 。 在 脱 靶 位 点 两 侧 设计 特异 性 引物 后 进行 PCR 扩 增 测 
序 ， 结 果 表 明 只 有 一 个 sgRNA ШИЕ ИЙЕ (图 4) 。 


靶 位 点 Target site: TTCTCCTATACCGGGCCCCTCGG 


靶 向 基因 On-target gene: XM 016588331.1 
TATTCTCCTATACCGGGCCACCTCGGTGCTG 编辑 后 After editing 
TATTCTCCTATACCGGGCC-CCTCGGTGCTG 编辑 前 Before editing 


脱 靶 基因 Off-target gene: XM 016581126.1 
TATTCT-----—---——-——-——— е GCTG 编辑 后 After editing 
TATTCTCCTATACCGGGCCCCTTGGTGCTG 编辑 前 Before editing 


图 4 一 个 sgRNA 的 脱 靶 编辑 
Fig. 4 The off-target editing of one sSRNA 


RI 突变 体 库 基因 编辑 情况 


Table 1 Gene editing in the mutant library 


ao EMAFI SEXE 基因 功 能 注释 编辑 ЛЭ 编辑 B 
E PAM Editing Editing 
Target site sequence Target gene Gene annotation Edite Off target gene Edite 
No. rate rate 
Serine 是 f 
1 ACCCGCATTATACAAGTCTG АСС ХМ 016631232.1 4/7 XM_016648616.1 0/7 
carboxypeptidase Yes No 
是 是 
2 TTCTCCTATACCGGGCCCCT CGG ХМ 016588331.1 Pullulanase pi 7/7 XM 016581126.1 8 7/7 
е$ ез 
是 
3 ATTTTGGGGAGCCAAACCTA GGG ХМ 016658716.1 | SPEAR3 y 6/7 
es 
Dihydroflavonol-4- — 1f 
4 GAAGCCATTCAAGGCTGTCA AGG NM 0013257322 0/7 
reductase No 
Dihydroflavonol-4- — 5 
NM. 001325630.2 0/7 
reductase No 
Phenylalanine 是 
5 GGAAGCCGGTGGTTCAGCTA GGG ХМ 016658955.1 5/7 
ammonia-lyase G4 Yes 
Senescence-specific 是 
6 GTACATTGATTCCGTCAACA АСС XM 016672759.1 7/7 
cysteine protease Yes 
E 
AE 
7 AGACGCCGGCCACCGCCTAT | GGG NM 001405192.1 — Osmotin 5 7/7 
е$ 
是 
8 TCCTCAGCTCAACTAACCAC TGG ХМ 016615814.1 Peroxidase P7 M 7/7 
е$ 
CBL-interacting a 
9 CTCATACATTCGGATAACAT TGG XM 016580175.1  serine/threonine-pr М 0/7 
0 
otein kinase 
CBL-interacting 
是 
XM 016594430.1  serine/threonine-pr " 7/7 
es 
otein kinase 
L-ascorbate 是 
10 | GACCGTTGGGTTCTCAGTTC CGG XM 016600478.1 6/7 
peroxidase 6 Yes 
是 
11  TTGTGGGTCAACAACAACTC AGG ХМ 016603279.] Cytochrome P450 Y 7/7 
es 
8 5 
12  TGTGTAGTGAACGCAGTCGC AGG NM 001325791.1 Tocopherol cyclase ng 0/7 XM 016621758.1 M 0/7 
0 0 
Vacuolar protein 
是 f 
13 CATGTACTGATCGGGGTCGA AGG ХМ 019379535.|] sorting-associated s 7/7 ХМ_030633095.1 " 0/7 
es 0 


protein 


14 


15 


16 


17 


18 


19 


20 


21 


22 


23 


24 


25 


26 


27 


28 


29 


GCCAAATTGGATGGAGCCTA 


CACAAGAGTACCTAGCATGA 


GCATTAGGAACAGTACTGAG 


GGCATAGAAACGGGCCGTGA 


GTTCCTTCTATGGAGATATC 


GCTGGCCTTAATCCTGATAA 


GGAGACGGCTTGTACAACGG 


TGTCCAAGAGACCGTCGGGT 


CTCCTCTGCAAGACGGCCAC 


CTATGATAAGTCTGTACCAG 


GCTGCGGTTGCATGGGAAGC 


CTGGAGAGTTGCCTAGTGGT 


TTGGTTCGAGGAAGTTGCGG 


AGAAGGCAGAGTAAAGACA 
G 


GAGACCTGCAGATCTACCCG 


CAAGCTGTAGGTTCCCGAGT 


AGG 


GGG 


AGG 


CGG 


TGG 


TGG 


CGG 


AGG 


GGG 


AGG 


CGG 


TGG 


AGG 


AGG 


CGG 


TGG 


XM 016596283.1 


XM 016657482.1 


XM 016608012.1 


XM 016655411.1 


NM 001326092.1 


NM 001325221.1 


NM 001325572.1 


XM 016650256.1 


XM 016616459.1 


NM 001325338.1 


XM 016644018.1 


XM 016635355.1 


XM 016620991.1 


XM 016637410.1 


XM 016647041.1 


XM 016602081.1 


XM 016645977.1 


XM 016642986.1 


NM 001325524.1 


NM 001325814.1 


Sugar 
ERD6 


Sucrose synthase 2 


Sucrose synthase 2 


Pectate lyase 


Beta-carotene 


hydroxylase 2 


Sugar transporter 


Ras-related protein 


RABF 


Ras-related protein 


RABF 


Abscisic acid 


receptor PYL 
Chlorophyll a-b 
binding protein 
Chlorophyll a-b 
binding protein 
SUMO-conjugating 
enzyme 
SUMO-conjugating 


enzyme 
Sucrose synthease 


Alcohol 
dehydrogenase 


Amidase 


Jasmonic 
acid-amido 
synthetae 
Quinolinate 


synthase 


Reticuline oxidase 


Detoxification 


transporter 


7/7 


7/7 


7/7 


7/7 


0/7 


7/7 


7/7 


7/7 


7/7 


0/7 


0/7 


7/7 


7/7 


7/7 


7/7 


6/7 


0/7 


7/7 


7/7 


6/7 


XM 016604443.1 


XM 016645822.1 


XM 016579318.1 


XM 016629727.1 


XM 016580920.1 


NM 001326242.1 


NM 001325543.1 


І 


Мо 


І 


Мо 


1 


0/7 


0/7 


0/7 


0/7 


0/7 


0/7 


0/7 


30 


31 


32 


33 


34 


35 


36 


37 


38 


39 


40 


41 


42 


43 


44 


45 


АТАТССАТССАТТСААСССА 


ATGCGGATGAGGCTCGTCGT 


TTTGCAAGGGAGACGTCATT 


AGCGTTCTGTGTTGCAGACA 


TTGCCCGTAATCCAAAAGGC 


TCTGTTGTAACCGGCAAGAC 


TCGAAACAGACAAATAAACA 


ATTGGTGACTGGGGACGTAA 


GACCACCAGGGCACTGGCTC 


GTTACCCGACCGGTCTTACA 


CTTGGTCTGCCCGATACTGG 


TCCGAGGATCACCACCCAAT 


AAATGTCCTAAGGAAAGCTG 


GAGGAGGGCTATTGCTGGAA 


GGAAGCGAATCTACGTAGGC 


ATGGAGTTGAATTCCTCAAT 


TGG 


AGG 


TGG 


AGG 


TGG 


TGG 


AGG 


AGG 


TGG 


AGG 


AGG 


GGG 


AGG 


CGG 


AGG 


AGG 


NM 016622703.1 


XM 016658217.1 


NM 001325509.1 


XM 016647590.1 


NM 001325865.1 


NM 001326113.1 


XM 016659636.1 


XM 016616941.1 


XM 016597780.1 


NM 001324627.1 


XM 016653822.1 


XM 016599368.1 


XM 016590747.1 


XM 016640747.1 


XM 016595403.1 


NM 001325834.1 


XM 009782556.1 


XR 001644690.1 


XM 016618980.1 


XM 016604255.1 


Cytochrome 


82C4 


Importin subunit 


MLO-like protein 


Reticuline oxidase 


Caffeoyl-CoA 
O-methltransferase 
delta12-fatty 

acid dehydrogenase 
delta12-fatty 

acid dehydrogenase 


ECERIFERUM 


Purple acid 


phosphatase 


Endochitinase 


Endochitinase 


Phospholipase 


Sucrose synthase 


Sterol 
3-beta-glucosyltran 


sferase 
Sucrose synthase 


Beta-carotene 
hydroxylase 2 
Beta-carotene 
hydroxylase 2 
Soluble 
synthase 3 


Sucrose synthase 


Sucrose synthase 


P450 


starch 


7/7 


7/7 


5/7 


0/7 


7/7 


5/7 


5/7 


7/7 


7/7 


7/7 


6/7 


2/7 


7/7 


7/7 


7/7 


7/7 


3/7 


6/7 


7/7 


5/7 


XM_016633095.1 


XM_016611295.1 


H 


No 


D 


No 


0/7 


0/7 


46 


47 


48 


49 


50 


51 


52 


53 


54 


55 


55 


56 


57 


58 


59 


60 


61 


62 


TACAAATGTGGAAAAGCCGG 


ATACTGGGAGCAACTGAGCT 


GTTGTGGGGCATGAGATTAC 


TGGGCAAAGGAGGAGCAAA 
G 


AGCTTCTTTGGCAACAGACT 


ATATCATCACGAATATATCG 


TGGGATTGAGCTGTGGGTAT 


GCTGTCGAAAATGCATGCGG 


TCGACTATAAGTGTTCCTTC 


ATTGCCTTAGGTTACGAAGC 


ATATGGTTCACCAAACCAAT 


GCAGGGTGAGCCGACTCAAC 


AACCTCTGTATGAGGGCACG 


ATAAGCAGTCAACCCCACAG 


AAGTGGGATCCCAACCTCTT 


ATTGAGCTTGCCAGAGATGT 


CGTCGTGAGAGAAACCGTCA 


TGG 


GGG 


TGG 


AGG 


TGG 


CGG 


TGG 


TGG 


AGG 


GGG 


GGG 


AGG 


AGG 


CGG 


TGG 


GGG 


AGG 


XM 016646488.1 


XM 016630467.1 


XM 016650499.1 


XM 016645712.1 


XM 016624910.1 


XM 016612129.1 


XM 016609474.1 


XM 016614797.1 


XM 016650365.1 


XM 016635292.1 


XM 016628980.1 


XM 016616473.1 


XM 016606799.1 


XM 016594514.1 


XM 016622845.1 


XM 016634593.1 


XM 016587327.1 


XM 001325947.1 


Sterol 
3-beta-glucosyltran 
sferase 
Cysteine-rich 
receptor like 
Alcohol 
dehydrogenase 


Histone 


Peroxidase 


2-oxoglutarate 
(20G) and 
Fe(ID)-dependent 


oxygenase 


Pectate lyase 


Peroxidase N-like 


Ferredoxin 


Dehydrodolichyl 
diphosphate 
synthase 
Dehydrodolichyl 
diphosphate 
synthase 
Alpha carbonic 
anhydrase 
V-type 
ATPase 


proton 


Oxygne-evolving 
enhancer 
DNA replication 
licensing factor 
7-deoxyloganetic 
8-acid 
glucosyltransferase 
Diamipelargonic 
acid amitransferase 
Pectin 


methylesterase 


6/7 


7/7 


7/7 


7/7 


7/7 


4/7 


7/7 


7/7 


7/7 


7/7 


7/7 


7/7 


7/7 


7/7 


7/7 


7/7 


7/7 


0/7 


XM 016656110.1 


XM 016635038.1 


XM 016623966.1 


XM 016609317.1 


XM 016609780.1 


0/7 


0/7 


0/7 


0/7 


0/7 


63 


64 


65 


66 


67 


68 


69 


70 


71 


72 


73 


74 


75 


76 


AGCTCCCTTATCATTCCTGG 


CAAGCATGAAAGCTATTGTA 


TGGCGCTCTTCCCACGAAAG 


TATTTTGGGGAGCCAAACCT 


TTTGTCATAAACTGCGGCTG 


GGTTCCACTCACAGGATCTC 


GACTTCGTTAAACATTGCAA 


TCTACTTCATCGGCGTCAGA 


CTGCTCACTGCTCTGTACAA 


AGATTGTGCGGTGGCTAGGA 


AGGATCACCAATCTACACCT 


CAATGCAAGACACTGAGGAT 


CAATGGTTCAAGGAGCTTCC 


ATCAGGGAATTGACCACCAC 


TGG 


GGG 


AGG 


AGG 


TGG 


TGG 


TGG 


AGG 


AGG 


TGG 


GGG 


TGG 


AGG 


CGG 


XM 016600950.1 


XM 016617986.1 


XM 016619685.1 


XM 016658716.1 


XM 016638848.1 


NM 001325626.1 


XM 016625417.1 


XM 016609851.1 


XM 001654047.1 


XM 016581441.1 


XM 016578497.1 


XM 016642867.1 


XM 016655158.1 


XM 016654239.1 


XM 016626275.1 


XM 016589953.1 


XM 016639678.1 


XM 016588741.1 


XM 016622691.1 


Glutaminase 


Beta-gulcosidase 


Beta-1,4-xylosyltra 


nsferase 


SPEAR3-like 


SPEAR3-like 


Nramp like 


Nramp like 


DA1-related 


DA1-related 


ATP carrier 


Chloride channel 


Copper transporting 
ATPase 


ATPase 


ATPase 


DA I-like 


DAI-like 


ATP-dependent 
DNA helicase 
NAD(P)-binding 
Rossmann-fold 
superfamily protein 
Mitogen-activated 


kinase 


йш 


Yes 


7/7 


6/7 


0/7 


7/7 


5/7 


7/7 


7/7 


7/7 


7/7 


6/7 


7/7 


6/7 


6/7 


6/7 


7/7 


7/7 


7/7 


7/7 


7/7 


NM 001324687.1 


XM 016623267.1 


XM 016648312.1 


0/7 


0/7 


0/7 


ID] 
І 


Receptor-like ^E 
77 | TATATCCGTGGAGACGAATA  TGG ХМ 016630199.1 7/7 XM 016602334.1 0/7 
protein Yes No 


3 讨论 
烟草 的 香味 来 源 于 在 烟叶 片 中 合成 并 累积 的 香味 化 学 成 分 。 香 味 相关 成 分 的 含量 和 种 类 受到 相 
关 代谢 途径 基因 的 类 型 及 表达 水 平 的 控制 。 受 限于 烟草 种 质 资源 遗传 基础 方面 的 研究 不 足 ， 烟 草 香 
味 品质 相关 代谢 物 合成 的 基因 尚未 被 大 规模 鉴定 。 烟 草 基 因 组 测序 和 基因 功能 注释 的 完成 为 烟草 香 
味 的 研究 提供 了 新 动力 。 本 研究 利用 生物 信息 学 分 析 获 得 了 100 个 与 烟草 香味 品质 相关 的 基因 ,大 
究 这 些 基 因 的 功能 可 为 后 续 改善 烟草 香味 品质 提供 基因 资源 。 

确定 某 个 基因 是 否 与 烟草 香味 相关 并 对 其 功能 进行 解析 很 大 程度 上 依赖 于 相关 基因 突变 体 的 
研究 。 基于 CRISPR/Cas9 的 基因 编辑 技术 日 趋 成 熟 ， 利 用 该 技术 研究 和 创制 不 同 香味 品质 的 烟草 种 
质 资源 对 于 烟草 工业 的 可 持续 发 展 尤为 重要 。 利用 CRISPR-Cas9 基因 编辑 技术 高 通 量 构建 突变 体 库 
己 经 应 用 于 水 稻 (Lu etal., 2017; Meng et al., 2017: Chen et al., 2022) . i$jü (Jacobs et al., 2017) Ж 
Ж (Liu et al., 2020) 和 大 豆 (Bai et al., 2020) 等 二 倍 体 植物 。 本 研究 成 功 将 CRISPR-Cas9 基因 编辑 
技术 应 用 于 四 倍 体 植物 烟草 的 突变 体 库 构 建 。 最 近 ，CRISPR-Cas9 基因 编辑 技术 成 功 已 应 用 于 油菜 
突变 体 库 的 构建 He etal., 2023) ， 这 也 是 该 技术 首次 应 用 于 十 字 花 科 的 蜡 源 四 倍 体 植物 。 本 研究 
的 编辑 对 象 烟草 是 茄 科 的 异 源 四 倍 体 植物 ， 该 突变 体 库 的 成 功 构 建 为 在 茄 科 多 倍 体 植物 中 开展 高 通 
量 靶 向 编辑 提供 了 一 个 成 功 的 案例 。 

利用 农 杆 菌 共 转化 获得 CRISPR-Cas9 基因 编辑 突变 体 库 的 方法 中 ， 共 转化 效率 、 编 辑 效率 和 脱 
轰 编 辑 率 是 研究 人 员 比 较 关 注 的 问题 。 本 研究 的 结果 表明 ， 烟 草 的 共 转 化 效率 可 以 达到 77%， 因 此 
可 以 获得 大 多 数 载体 的 转基因 烟草 ， 这 保证 了 烟草 基因 突变 体 库 的 高 覆盖 率 。 烟 草 的 转基因 通过 愈 
伤 组 织 转化 实现 ， 单 次 转 转化 的 基因 编辑 效率 高 。 本 研究 证 明 ， 共 转化 多 基因 编辑 载体 同样 可 以 实 
现 较 高 的 基因 编辑 效率 (89.6%) 。CRISPR-Cas9 基因 编辑 技术 潜在 的 脱 靶 作用 是 制约 其 应 用 的 一 
个 主要 因素 。 本 研究 进行 了 脱衣 位 点 分 析 ， 结 果 显 示 ，77 个 sgRNA 中 只 有 1 ARM RAE Y BUB 
辑 , 这 说 明 CRISPR-Cas9 对 靶 位 点 的 识别 具有 很 强 的 特异 性 。 由 于 本 研究 未 进行 全 基因 组 测序 分 析 ， 
所 以 不 能 排除 编辑 植株 仍然 存在 脱 训 编辑 的 可 能 性 。 值 得 提 及 的 是 ,在 编辑 植物 中 总 能 筛选 到 Caso 
基因 与 编辑 位 点 位 于 不 同 染 色 体 上 的 植株 ， 在 育种 实践 中 可 以 通过 遗传 分 离 和 纯化 选择 去 除 转基因 
标签 或 脱 靶 编辑 位 点 。 


we 


4 结论 
本 研究 利用 CRISPR/Cas9 技术 成 功 构 建 了 烟草 香味 相关 基因 的 突变 库 , 表明 CRISPR/Cas9 基因 
i 辑 技 术 高 通 量 编辑 烟草 基因 可 用 于 构建 烟草 突变 库 ， 该 方法 具有 共 转 化 效率 高 ， 鞭 向 编辑 效率 高 


Ng 


和 脱衣 编辑 低 等 特点 。 本 研究 为 烟草 香味 功能 基因 的 研究 提供 了 遗传 资源 ， 为 烟草 香味 重要 性 状 的 


分 子 改良 提供 了 种 质 资 源 。 该 技术 方法 并 不 是 仅 限 于 构建 烟草 香味 品质 相关 基因 的 突变 体 库 ， 而 是 
可 用 于 在 烟草 中 构建 研究 人 员 感 兴趣 的 任何 性 状 的 基因 突变 体 库 ， 这 将 加 速 烟草 功能 基因 的 研究 。 
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